آموزش SPSS مقدماتی و پیشرفته تهیه و تنظیم: فرزانه صانعی مدیریت آمار و فناوری اطالعات - مهرماه 96
بخش سوم: مراحل تحلیل آماری تحلیل داده ها به روش پارامتری بررسی نرمال بودن توزیع داده ها قضیه حد مرکزی جدول انتخاب نوع آزمون پارامتری معرفی فرمان t-test یک نمونه ای
ادامه بخش سوم: معرفی فرمان t-test معرفی فرمان t-test تحلیل داده ها به روش پارامتری دو نمونه ای مستقل نمونه دو آزمون آنالیز واریانس یک طرفه ای جور شده )One-Way ANOVA( آزمونهای تکمیلی آنالیز واریانس )Post Hoc(
مراحل تحلیل آماری انتخاب آزمون تحلیلی متناسب بررسی نرمال بودن داده کمی توصیف داده ها
بررسی نرمال بودن توزیع داده ها نرمال بودن توزیع داده ها تنها برای داده های کم ی بررسی می شود زیرا داده های کیفی ذاتا غیر نرمال هستند و نیازی به بررسی آنها نیست. منظور از داده کم ی داده ای است با مقیاس های فاصله ای و یا نسبی
در تئوری احتماالت توزیع های احتمالی مختلفی برای داده های جامعه آماری تعریف شده است. بعضی از آنها مربوط به داده های کم ی پیوسته و بعضی مربوط به داده های کم ی گسسته اند. یکی از مهم ترین توزیع های احتمالی پیوسته توزیع است. اهمیت توزیع نرمال در این است که بسیاری از پدیده های طبیعی از این توزیع پیروی می کنند.
در شکل زیر یک منحنی نرمال با منحنی هایی که توزیع آنها چولگی و کشیدگی دارد مقایسه شده است.
شکل زیر یک منحنی نرمال را نشان می دهد. در یک توزیع نرمال %68.2 از داده ها به فاصله یک انحراف معیار از میانگین قرار دارند. %95.4 در فاصله دو انحراف معیار و %99.6 در فاصله 3 انحراف معیار از میانگین قرار دارند.
همانطور که در بخش دوم گفته شد ترسیم منحنی نرمال در گراف هیستوگرام یکی از راههای تشخیص نرمال بودن توزیع داده هاست. هیستوگرام وزن قبل و بعد افراد بر اساس فایل Ex1.sav به صورت زیر است.
رسم نمودار P-P plot روش دیگر تشخیص نرمال بودن است. برای اینکار مسیر زیر را دنبال کنید.
نمودار P-P plot وزن قبل و بعد افراد بر اساس فایل Ex1.sav به صورت زیر است. نزدیک بودن نقاط به قطر رسم شده نشاندهنده شباهت توزیع به نرمال است.
اما روش قابل اطمینان به کار بردن آزمون کولموگروف- اسمیرنوف است که شکل توزیع داده ها را با توزیع های شناخته شده و به طور پیشفرض توزیع نرمال مقایسه می کند.
برای اینکار مطابق شکل زیر فرمان 1-Sample K-S را اجرا کنید.
جدول زیر در پنجره Output نرم افزار نمایش داده می شود. One-Sample Kolmogorov-Smirnov Test W_before W_after N 90 90 Mean 90.7222 83.8333 Normal Parameters a,b Std. Deviation 7.22982 7.25034 Absolute.114.136 Most Extreme Differences Positive.114.136 Negative -.070 -.073 Kolmogorov-Smirnov Z 1.082 1.291 Asymp. Sig. (2-tailed).192.071 a. Test distribution is Normal. b. Calculated from data.
این آزمون برآورد می کند تفاوت معنی داری بین توزیع داده های موجود با توزیع نرمال وجود دارد یا خیر مقدار بزرگتر از 0.05 در مقابل سطر Sig به معنای عدم وجود اختالف معنی دار توزیع داده ها با نرمال است. به عبارت دیگر نتیجه آزمون نرمال بودن داده های مثال Ex1 نشان می دهد توزیع داده ها شبیه به توزیع نرمال است.
قضیه حد مرکزی اگر X1,X2, دنباله ای از متغیرهای تصادفی مستقل با توزیع یکسان با میانگین µ و انحراف معیار σ باشند توزیع عبارت زیر به توزیع متغیر تصادفی نرمال استاندارد (0,1)N میل می کند.
مفهوم آن این است که بسیاری از پدیده های طبیعی با تقریب خوبی دارای توزیع نرمال استاندارد است. پدیده هایی که هرچند به طور جداگانه از توزیع نرمال پیروی نمی کنند اما توزیع مجموع آنها به توزیع نرمال شباهت دارد. رایج ترین کاربرد قضیه حدمرکزی هنگام نمونه گیری برای پژوهش هاست که همواره توصیه می شود نمونه بزرگتر از 30 اخذ شود تا بتوان توزیع آنها را نرمال فرض کرد.
جدول انتخاب نوع آزمون پارامتری بعد از اطمینان از نرمال بودن متغیرها انتخاب آزمون پارامتری مناسب به کمک جدول زیر امکانپذیر است. تعداد و وضعیت متغیرها عنوان فرمان در SPSS یک گروه One Sample T-test دو گروه مستقل Independent Samples T-test وابسته Dependent Samples T-test بیش از دو گروه مستقل One-Way ANOVA وابسته Repeated Measures ANOVA
معرفی فرمان t-test نمونه ای یک زمانی که بخواهیم آزمون کنیم میانگین یک جامعه برابر با عدد خاصی است یا خیر از این آزمون استفاده می کنیم. برای مثال فرض کنید ادعا شده با به کار بردن روش تغذیه ای خاصی میانگین وزن افراد به 60 کیلوگرم می رسد.
برای اجرای فرمان مسیر زیر را مطابق شکل دنبال کنید.
با کلیک بر روی گزینه One-Sample T-test پنجره زیر باز می شود. متغیری را که می خواهید میانگین آن را آزمون کنید به کادر Variable(s) Test ببرید و در قسمت Test Value میانگین فرضیه را وارد کنید.
در این مثال وزن بعد )W_after( را انتخاب می کنیم و فرض می کنیم ادعا شده با اعمال رژیم های تغذیه ای میانگین وزن به عدد 80 می رسد. عدد 80 را در مربع پایین پنجره وارد می کنیم.
Out put با کلیک بر روی دکمه Ok افزار مالحظه کنید. نتیجه را در نرم One-Sample Statistics N Mean Std. Deviation Std. Error Mean W_after 90 83.8333 7.25034.76425 One-Sample Test Test Value = 80 t df Sig. (2-tailed) Mean Difference 95% Confidence Interval of the Difference Lower Upper W_after 5.016 89.000 3.83333 2.3148 5.3519
میانگین نمونه 83.83 است در حالی که ادعا شده میانگین به 80 می رسد. تفسیر جدول زیر به این صورت است که نمی توان ادعا را پذیرفت. زیرا عدد ادعا شده با عدد واقعی تفاوت معناداری دارد. One-Sample Test Test Value = 80 t df Sig. (2-tailed) Mean Difference 95% Confidence Interval of the Difference Lower Upper W_after 5.016 89.000 3.83333 2.3148 5.3519
معرفی فرمان دو t-test نمونه ای مستقل زمانی که بخواهیم آزمون کنیم دو مجموعه داده های در دسترس از جامعه همانند استخراج شده اند یا خیر از آزمون برابری میانگین t-test دو نمونه ای استفاده می کنیم. برای اجرای این فرمان از منوی Analyze به زیر منوی Compare Means اشاره و از لیست باز شده زیرمنوی Independent-Samples T test را انتخاب می کنیم.
با اینکار پنجره ای به شکل زیر باز می شود.
در پنجره باز شده یک متغیر را به کادر Test Variable می بریم و در کادر Grouping by متغیر گروه بندی را منتقل می کنیم. در اینجا می باید دو گروه را به عنوان گروههای مستقل مورد آزمون تعیین کنیم. برای اینکار روی دکمه Define Group کلیک می کینم.
کادری به شکل زیر باز می شود که در آن نام گروه های مورد آزمون را وارد می کنیم. در اینجا گروههای 1 و 2 را انتخاب کرده ایم. روی دکمه Continue کلیک کنید تا پنجره بسته شود. پنجره اصلی تست را با دکمه ok ببندید و نتیجه را در فایل Out put نرم افزار ببینید.
Ex.1 نتیجه آزمون t-test برای دو نمونه مستقل در مثال Group Statistics Group N Mean Std. Deviation Std. Error Mean W_after Health 30 82.3333 6.24960 1.14102 Diabetic 30 86.4667 7.50050 1.36940
نتیجه آزمون برای دو نمونه مستقل در مثال Ex.1 t-test Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of Means 95% Confidence Interval of the Difference Sig. (2- Mean Std. Error F Sig. t df tailed) Difference Difference Lower Upper W_after Equal variances 3.117.083-2.319 58.024-4.13333 1.78246 - -.56535 assumed 7.70132 Equal variances -2.319 56.171.024-4.13333 1.78246 - -.56288 not assumed 7.70379
آزمون Levene فرض برابری واریانس ها را می سنجد. چنانچه نشانگر این آزمون کمتر از 0.05 باشد نشان می دهد فرض برابری واریانس ها را نمی توان رد کرد. به عبارتی می توان فرض کرد نمونه ها از جامعه هایی با واریانس یکسان استخراج شده اند. در این مثال عدد 0.083 نشان می دهد نمی توان واریانس ها را برابر فرض کرد. در اینجا باید اعداد سطر دوم جدول را مورد استفاده قرار داد assumed(.)equal variances not
مقدار 0.024 برای (2-tailed) Sig. نشاندهنده وجود اختالف معنی دار بین میانگین وزن بعد از رژیم گروه یک )افراد سالم( با گروه 2 )افراد دیابتیک( وجود دارد.
معرفی فرمان t-test دو نمونه ای جور شده از این فرمان بیشتر در مطالعات کوهورت استفاده می شود. مانند مثال Ex1 که در آن با اعمال سه نوع رژیم خاص می خواهیم تاثیر هریک را روی وزن افراد بسنجیم. در اینجا در هر سطر اطالعات یک واحد نمونه در دو ستون ثبت شده یک ستون وزن فرد قبل از دریافت رژیم و ستون دیگر وزن همان فرد را بعد از دریافت رژیم نشان می دهد.
برای دسترسی به این فرمان مسیر را مطابق شکل زیر دنبال کنید.
با کلیک بر روی گزینه Paired samples T test پنجره زیر باز می شود. W_before را به خانه اول سطر اول در کادر Paired Variables و W_after را به خانه دوم آن سطر می بریم.
بعد از انتقال متغیرها روی دکمه ok کلیک کنید و نتیجه را در فایل Out put نرم افزار مشاهده کنید.
نتیجه آزمون Paired Samples T test Paired Samples Statistics Mean N Std. Deviation Std. Error Mean Pair 1 W_before 90.7222 90 7.22982.76209 W_after 83.8333 90 7.25034.76425 Paired Samples Correlations N Correlation Sig. Pair 1 W_before & W_after 90.893.000
نتیجه آزمون Paired Samples T test مشاهده مقدار 0 برای (2-tailed) Sig. به این معنی است که اختالف بین میانگین وزن قبل از رژیم و بعد از رژیم معنادار است. Paired Samples Test Paired Differences 95% Confidence Interval Std. Std. Error of the Difference Sig. (2- Mean Deviation Mean Lower Upper t df tailed) Pair 1 W_before - W_after 6.88889 3.35014.35314 6.18721 7.59056 19.508 89.000
آزمون آنالیز واریانس یک طرفه ANOVA( )One-Way از این فرمان زمانی استفاده می شود که بخواهیم اختالف میانگین ها را در بیش از دو گروه با هم مقایسه کنیم. در این مثال الزم است میانگین وزن افراد تحت درمان با سه نوع رژیم غذایی به طور همزمان مقایسه شوند.
برای اجرای این فرمان مسیر را مطابق شکل زیر دنبال کنید.
با کلیک بر روی گزینه One-Way ANOVA باز می شود. پنجره زیر
در این پنجره متغیر های W_before و W_after را به کادر Dependent List می بریم و متغیر Group را به کادر Factor می بریم. زیرا می خواهیم اختالف میانگین ها را بر اساس فاکتور نوع رژیم بسنجیم.
با کلیک بر روی دکمه ok می توانیم نتیجه را در پنجره Out put نرم افزار ببینیم. ANOVA Sum of Squares df Mean Square F Sig. W_before Between Groups 85.422 2 42.711.814.447 Within Groups 4566.633 87 52.490 Total 4652.056 89 W_after Between Groups 314.067 2 157.033 3.130.049 Within Groups 4364.433 87 50.166 Total 4678.500 89
در ستون Sig مالحظه می کنید به ازای میانگین گروهها در متغیر وزن قبل شاخص 0.447 و به ازای میانگین گروهها در متغیر وزن بعد شاخص 0.049 محاسبه شده است. تفسیر آن است که قبل از اعمال رژیم میانگین گروهها تفاوت معناداری نداشتند به عبارتی تقریبا همگن بودند ولی با اعمال سه نوع رژیم اختالف بین میانگین های گروهها معنادار شد.
در پنجره اصلی One-Way ANOVA اینبار روی دکمه Options کلیک کنید. پنجره ای به شکل زیر باز می شود.
انتخاب گزینه Homogeneity of variance test باعث اجرای آزمون levene برای برابری واریانس ها می شود. روی Continue کلیک کنید و نتیجه را در فایل Out put ببینید. Test of Homogeneity of Variances Levene Statistic df1 df2 Sig. W_before.535 2 87.588 W_after 1.319 2 87.273 نتیجه آزمون نشان می دهد فرض برابری واریانس ها پذیرفتنی نیست.
آزمونهای تکمیلی آنالیز واریانس Hoc( )Post وقتی نتجه آزمون آنالیز واریانس نشان می هد اختالف بین میانگین ها وجود دارد باید مشخص کرد منبع این اختالف چیست و اینکه کدام گروه با دو گروه دیگر اختالف دارد. برای این کار از آزمون های تکمیلی یا Post Hoc استفاده می شود.
مجددا پنجره روی دکمه می شود. One-Way ANOVA را باز کنید و اینبار Post Hoc کلیک کنید. پنجره سمت راست باز
آزمونهای تکمیلی متعددی برای اینکار وجود دارد. یک تعدادی از آنها برای واریانس های همسان است که در بخش Equal Variance Assumed دیده می شوند و تعدادی برای واریانس های نا برابر است که در بخش Equal Variance Not Assumed دیده می شوند. در این مثال از بخش آزمون Tamhanes T2 را انتخاب می کنیم. با کلیک بر روی دکمه Continue پنجره را ببندید. Equal Variance Not Assumed
با کلیک بر روی ok در پنجره اصلی ANOVA نتیجه را ببینید. Multiple Comparisons Dependent Mean Difference 95% Confidence Interval Variable (I) Group (J) Group (I-J) Std. Error Sig. Lower Bound Upper Bound W_before Health Diabetic -.73333 1.84816.971-5.2796 3.8130 Hypertansion -2.33333 1.82110.498-6.8123 2.1456 Diabetic Health.73333 1.84816.971-3.8130 5.2796 Hypertansion -1.60000 1.94059.798-6.3713 3.1713 Hypertansion Health 2.33333 1.82110.498-2.1456 6.8123 Diabetic 1.60000 1.94059.798-3.1713 6.3713 W_after Health Diabetic -4.13333 1.78246.070-8.5200.2533 Hypertansion -.36667 1.77238.996-4.7281 3.9948 Diabetic Health 4.13333 1.78246.070 -.2533 8.5200 Hypertansion 3.76667 1.92735.157 -.9720 8.5053 Hypertansion Health.36667 1.77238.996-3.9948 4.7281 Diabetic -3.76667 1.92735.157-8.5053.9720
با سپاس از دقت و حوصله شما پایان جلسه سوم